智能论文笔记

Social-Aware Clustered Federated Learning with Customized Privacy Preservation

Yuntao Wang , Zhou Su , Yanghe Pan , Tom H Luan , Ruidong Li , Shui Yu

分类：机器学习

2022-12-25

A key feature of federated learning (FL) is to preserve the data privacy of end users. However, there still exist potential privacy leakage in exchanging gradients under FL. As a result, recent research often explores the differential privacy (DP) approaches to add noises to the computing results to address privacy concerns with low overheads, which however degrade the model performance. In this paper, we strike the balance of data privacy and efficiency by utilizing the pervasive social connections between users. Specifically, we propose SCFL, a novel Social-aware Clustered Federated Learning scheme, where mutually trusted individuals can freely form a social cluster and aggregate their raw model updates (e.g., gradients) inside each cluster before uploading to the cloud for global aggregation. By mixing model updates in a social group, adversaries can only eavesdrop the social-layer combined results, but not the privacy of individuals. We unfold the design of SCFL in three steps. \emph{i) Stable social cluster formation. Considering users' heterogeneous training samples and data distributions, we formulate the optimal social cluster formation problem as a federation game and devise a fair revenue allocation mechanism to resist free-riders. ii) Differentiated trust-privacy mapping}. For the clusters with low mutual trust, we design a customizable privacy preservation mechanism to adaptively sanitize participants' model updates depending on social trust degrees. iii) Distributed convergence}. A distributed two-sided matching algorithm is devised to attain an optimized disjoint partition with Nash-stable convergence. Experiments on Facebook network and MNIST/CIFAR-10 datasets validate that our SCFL can effectively enhance learning utility, improve user payoff, and enforce customizable privacy protection.

translated by 谷歌翻译

Let Me Check the Examples: Enhancing Demonstration Learning via Explicit Imitation

Sirui Wang , Kaiwen Wei , Hongzhi Zhang , Yuntao Li , Wei Wu

分类：机器学习 | 人工智能

2022-08-31

示范学习旨在通过在少数射击设置中提供回答的演示来指导及时的预测。尽管取得了令人鼓舞的结果，但现有工作仅将回答的示例与及时模板（包括原始上下文）相连，而无需任何其他操作，从而忽略了迅速示意的依赖性。此外，先前的研究发现，随机替换示威的标签极小地损害了性能，这表明该模型无法正确地了解示威活动所带来的知识。受到人类学习过程的启发，在本文中，我们引入了模仿演示学习（模仿），以通过明确模仿人类审查行为来加强演示学习，其中包括：（1）对比度学习机制，以专注于类似的演示。（2）证明标签重新预测方法以合并已知知识。实验结果表明，我们提出的方法在14个分类中心中有11个实现了最先进的性能。进一步的研究还证明，模仿 - demo加强了迅速与示威之间的关联，这可以为探索示范学习的工作方式提供基础。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Wavelet Prior Attention Learning in Axial Inpainting Network

Chenjie Cao , Chengrong Wang , Yuntao Zhang , Yanwei Fu

分类：计算机视觉

2022-06-07

图像介入是将图像的掩盖或未知区域填充具有视觉上现实内容的任务，最近，深层神经网络（DNNS）极大地改善了图像。从本质上讲，作为一个反问题，内部介绍面临着在没有纹理伪像的情况下重建语义相干结果的根本挑战。以前的许多努力是通过利用注意机制和先验知识（例如边缘和语义分割）做出的。但是，这些作品在实践中仍然受到可学习的先验参数和刺激性计算负担的限制。为此，我们提出了一个新颖的模型 - 轴向镶嵌网络（WAIN）中的小波事先注意学习，其发电机包含编码器，解码器以及小波图像的两个关键组件先验注意力（WPA）和堆叠的多层层轴向转化器（ATS）。特别是，WPA指导多尺度频域中的高级特征聚集，从而减轻了文本伪像。堆叠的ATS采用未掩盖的线索来帮助建模合理的功能以及水平和垂直轴的低级特征，从而提高语义连贯性。对Celeba-HQ和Place2数据集进行了广泛的定量和定性实验，以验证我们的Wain可以在竞争对手上实现最新的性能。代码和模型将发布。

translated by 谷歌翻译

GIFS: Neural Implicit Function for General Shape Representation

Jianglong Ye , Yuntao Chen , Naiyan Wang , Xiaolong Wang

分类：计算机视觉

2022-04-14

神经隐式功能的最新发展已在高质量的3D形状重建方面表现出巨大的成功。但是，大多数作品将空间分为形状的内部和外部，从而将其代表力量限制为单层和水密形状。这种局限性导致乏味的数据处理（将非紧密的原始数据转换为水密度），以及代表现实世界中一般对象形状的无能。在这项工作中，我们提出了一种新颖的方法来表示一般形状，包括具有多层表面的非水平形状和形状。我们介绍了3D形状（GIF）的一般隐式函数，该功能建模了每两个点之间的关系，而不是点和表面之间的关系。 GIF没有将3D空间分为预定义的内部区域，而是编码是否将两个点分开。 Shapenet上的实验表明，在重建质量，渲染效率和视觉保真度方面，GIF的表现优于先前的最先进方法。项目页面可从https://jianglongye.com/gifs获得。

translated by 谷歌翻译

MobilePhys: Personalized Mobile Camera-Based Contactless Physiological Sensing

Xin Liu , Yuntao Wang , Sinan Xie , Xiaoyu Zhang , Zixian Ma , Daniel McDuff , Shwetak Patel

分类：计算机视觉

2022-01-11

基于相机的非接触式光电子溶血性描绘是指一组流行的非接触生理测量技术。目前的最先进的神经模型通常以伴随金标准生理测量的视频以监督方式培训。但是，它们通常概括域名差别示例（即，与培训集中的视频不同）。个性化模型可以帮助提高型号的概括性，但许多个性化技术仍然需要一些金标准数据。为了帮助缓解这一依赖性，在本文中，我们展示了一种名为Mobilememon的新型移动感应系统，该系统是第一个移动个性化远程生理传感系统，它利用智能手机上的前后相机，为培训产生高质量的自我监督标签个性化非接触式相机的PPG模型。为了评估MobilemeLephys的稳健性，我们使用39名参与者进行了一个用户学习，他们在不同的移动设备下完成了一组任务，照明条件/强度，运动任务和皮肤类型。我们的研究结果表明，Mobilephys显着优于最先进的设备监督培训和几次拍摄适应方法。通过广泛的用户研究，我们进一步检查了Mobilephys如何在复杂的真实环境中执行。我们设想，从我们所提出的双摄像机移动传感系统产生的校准或基于相机的非接触式PPG模型将为智能镜，健身和移动健康应用等许多未来应用打开门。

translated by 谷歌翻译

Label Relation Graphs Enhanced Hierarchical Residual Network for Hierarchical Multi-Granularity Classification

Jingzhou Chen , Peng Wang , Jian Liu , Yuntao Qian

分类：计算机视觉

2022-01-10

分层多粒度分类（HMC）将分层多粒度标签分配给每个对象，专注于对标签层次结构进行编码，例如[“Albatross”，“Laysan Albatross”]从粗略级别进行。然而，细粒度的定义是主观的，并且图像质量可能会影响识别。因此，可以在层次结构的任何水平处观察样本，例如，例如，[“信天翁”]或[“白金贸易”，“Laysan Albatross”，并且在致动类别中辨别的示例在HMC的传统设置中通常被忽略。在本文中，我们研究了HMC问题，其中对象在层次结构的任何级别上标记。所提出的方法的基本设计源自两个动机：（1）学习在各个级别标记的物体应该转移级别之间的分层知识; （2）较低级别的类应继承与上级超类相关的属性。所提出的组合损失通过从树层次结构中定义的相关标签聚合信息来最大化观察到的地面真实标签的边际概率。如果观察到的标签处于叶片水平，则组合损失进一步施加了多级跨熵损失，以增加细粒度分类损失的重量。考虑到分层特征交互，我们提出了一个分层剩余网络（HRN），其中来自父级的粒度特定特征作为残留连接的特定特征被添加到儿童级别的特征。与最先进的HMC方法和精细的视觉分类（FGVC）方法相比，三种常用数据集的实验证明了我们的方法的有效性和利用标签层次结构的方法。

translated by 谷歌翻译

Pay More Attention to History: A Context Modeling Strategy for Conversational Text-to-SQL

Yuntao Li , Hanchu Zhang , Yutian Li , Sirui Wang , Wei Wu , Yan Zhang

分类：自然语言处理 | 人工智能

2021-12-16

会话文本到SQL旨在将多圈自然语言查询转换为相应的SQL表示。会话文本到SQL最棘手的问题之一是建模多转查询的语义，并收集当前查询所需的正确信息。本文显示通过添加每个转弯和整个上下文的总结来显式建模语义更改，可以在将会话查询转换为SQL的情况下提高性能。特别是，我们在转弯谷物和谈话谷物中提出了两个会话建模任务。这两个任务只是用作辅助培训任务，以帮助多转对会话语义解析。我们在大型开放式对话文本到SQL数据集中进行了实证研究，实现了新的最先进结果。结果表明，该机制显着提高了多转语义解析的性能。

translated by 谷歌翻译

Two Wrongs Don't Make a Right: Combating Confirmation Bias in Learning with Label Noise

Mingcai Chen , Hao Cheng , Yuntao Du , Ming Xu , Wenyu Jiang , Chongjun Wang

分类：机器学习

2021-12-06

嘈杂的标签损坏了深网络的性能。为了稳健的学习，突出的两级管道在消除可能的不正确标签和半监督培训之间交替。然而，丢弃观察到的标签的部分可能导致信息丢失，尤其是当腐败不是完全随机的时，例如依赖类或实例依赖。此外，从代表性两级方法Dividemix的训练动态，我们确定了确认偏置的统治：伪标签未能纠正相当大量的嘈杂标签，因此累积误差。为了充分利用观察到的标签和减轻错误的校正，我们提出了强大的标签翻新（鲁棒LR）-a新的混合方法，该方法集成了伪标签和置信度估计技术来翻新嘈杂的标签。我们表明我们的方法成功减轻了标签噪声和确认偏差的损害。结果，它跨数据集和噪声类型实现最先进的结果。例如，强大的LR在真实世界嘈杂的数据集网络VIVION上以前最好的绝对高度提高了4.5％的绝对顶级精度改进。

translated by 谷歌翻译

Immortal Tracker: Tracklet Never Dies

Qitai Wang , Yuntao Chen , Ziqi Pang , Naiyan Wang , Zhaoxiang Zhang

分类：计算机视觉

2021-11-26

以前的在线3D多对象跟踪（3DMOT）方法在与几帧的新检测无关时终止ROCKET。但是如果一个物体刚刚变暗，就像被其他物体暂时封闭或者只是从FOV暂时封闭一样，过早地终止ROCKET将导致身份切换。我们揭示了过早的轨迹终端是现代3DMOT系统中身份开关的主要原因。为了解决这个问题，我们提出了一个不朽的跟踪器，一个简单的跟踪系统，它利用轨迹预测来维护对象变暗的物体的轨迹。我们使用一个简单的卡尔曼滤波器进行轨迹预测，并在目标不可见时通过预测保留轨迹。通过这种方法，我们可以避免由过早托管终止产生的96％的车辆标识开关。如果没有任何学习的参数，我们的方法在Waymo Open DataSet测试集上的车载类别的0.0001级和竞争Mota处实现了不匹配的比率。我们的不匹配比率比任何先前发表的方法低一倍。在NUSCENes上报告了类似的结果。我们相信拟议的不朽追踪器可以为推动3DMOT的极限提供简单而强大的解决方案。我们的代码可在https://github.com/immortaltracker/immortaltracker中找到。

translated by 谷歌翻译